مدلی برای تحلیل و تولید متن وبلاگ فارسی
پایان نامه
- وزارت علوم، تحقیقات و فناوری - دانشگاه صنعتی امیرکبیر(پلی تکنیک تهران) - دانشکده ریاضی و کامپیوتر
- نویسنده فرزانه سرافراز
- استاد راهنما محمدابراهیم شیری رضا عزمی
- تعداد صفحات: ۱۵ صفحه ی اول
- سال انتشار 1385
چکیده
هدف از این پروژه استفاده از پیکره ی متنی وبلاگ های فارسی برای استخراج اطلاعات زبان شناختی و یافتن مدلی برای تولید خودکار متن فارسی است. مهم ترین ابزار مورد نیاز برای حل مسایل مختلف به روش تجربی در حیطه ی پردازش زبان طبیعی وجود پیکره ی زبانی بزرگ و متعادل است در زبان فارسی با رشد کمی وبلاگ های فارسی در سال های اخیر چنین پیکره ی متنی بزرگی در وجود دارد. این پیکره با اینکه خصوصیات یک پیکره ی متعادل را ندارد. اما ویژگی هایی دارد که آن را برای تحلیل زبان شناختی مناسب می کند. برای اینکه پیکره ی بسیار ناهمگن وبلاگ های فارسی را که در زمان ها و موقعیت های مختلف نوشته شده و نویسنده های متعدد دارد. تبدیل به پیکره ی مناسبی برای پردازش ماشینی کنیم روی آن انواعی از پیش پردازش ها انجام می دهیم و سپس با روش های مختلف آماری ویژگی های زبان شناختی آن را بررسی می کنیم. در پایان مدلی برای تولید خودکار متن مشابه پیشنهاد می کنیم و نتایج حاصل از تولید خودکار متن را ارزیابی می کنیم
منابع مشابه
ساختار وبلاگهای فارسی روزنامه نگاری تحلیل محتوای وبلاگ های فارسی روزنامه نگاران ایرانی
وبلاگ فرم خاصی از وبسایت است که به طور متناوب به روز می شود و در آن مطالب به ترتیب تاریخ مرتب می شوند. این فرم ساده و انعطاف پذیر، وبلاگ را به رسانه ای با پتانسیل بالا برای استفاده های شخصی و حرفهای تبدیل کرده است. مهم تر از همه، فضایی را در اختیار مردم قرار می دهد تا بتوانند جهان را آنگونه که می بینند بیان کنند. این پژوهش تلاش می کند تصویری از چیستی وبلاگ و ساختار و محتوای آن ارائه دهد. ضمن آن...
متن کاملتحلیل محتوا وبلاگ های عکاسی فارسی ایران
چکیده این پایان نامه با هدف تحلیل محتوای وبلاگ های عکاسی فارسی انجام پذیرفته شده است. در این پژوهش کوشش نموده ایم محتوای وبلاگ های عکاسی فارسی را در زمینه های همچون آموزش ، نقد و تحلیل آثار عکاسی ، معرفی رویکرد ها و ابزار های جدید عکاسی مورد ارزیابی قرار دهیم. در این پایان نامه مفاهیم کلیدی مانند اطلاعاتی شدن، دیجیتالی شدن و رسانه ای شدن جامعه را که منجر به پیدایش وبلاگ شده است را تبیین نمود...
وابستگی درونی میان فرآیند و تولید متن خوانداری در انگلیسی و فارسی
در حالیکه این واقعیت که خواندن در زبان دوم امر دشواری برای اغلب زبان آموزان انگلیسی است، در ادبیات تحقیق بخوبی منعکس شده است، اما با این وجود هنوز این مسئله روشن نیست که این دشواری از مشکل یادگیری زبان ناشی می شود و یا دشواری درخواندن. "خواندن در زبان خارجی: یک مشکل خواندن و یا یک مشکل یادگیری است؟"(الدرسون ۱۹۸۴). در اینجا" مشکل زبانی" به ضعف در دانش و مهارتهای مورد نیاز برای پردازش مشخصه های ز...
متن کاملارائه مدلی برای تحلیل محتوای سیاستهای فرهنگی
این مقاله، بر آن است که مدلی برای تحلیل محتوای سیاستهای فرهنگی بدست دهد. منظور از سیاستهای فرهنگی در این مقاله به طور خاص سیاستهایی است که از جانب دولت به صورت مکتوب و مصوب ارائه میشود تا زمینهای برای مدیریت فرهنگی (برنامهریزی و سازماندهی و هدایت منابع و نیروها) باشد. مدل باید به دنبال پیدا کردن عقلانیت حاکم بر سیاست فرهنگی باشد. به منظور دستیابی به این مدل، ضمن مطالعه ادبیات موضوع به مس...
متن کاملمنابع من
با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید
ذخیره در منابع من قبلا به منابع من ذحیره شده{@ msg_add @}
نوع سند: پایان نامه
وزارت علوم، تحقیقات و فناوری - دانشگاه صنعتی امیرکبیر(پلی تکنیک تهران) - دانشکده ریاضی و کامپیوتر
میزبانی شده توسط پلتفرم ابری doprax.com
copyright © 2015-2023